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Stand der Technik 

Die Erfindung betrifft ein Verfahren und eine Vorrichtung 
zur darstellungsoptimierten Obertragung von Video- und 
Audiodaten gemali den Oberbegrif f en der Patentanspruche 1 
und 15- 

Es gibt bereits Kommunikationsdienste und -systeme, die 
neben dem auditiven Bereich auch visuelle Medien bzw. 
Kanale zur Obermittlung von Ton- und Bildinf ormation 
anbieten. 

Bereits heute kommen z. B, bei Videokonf erenzsystemen 
Bildbearbeitungsalgorithmen zum Einsatz (WO96/09722) . 

Die DE-0402895 CI beschreibt ein Verfahren und eine 
Vorrichtung zur Korrektur des Augenwinkels bei Arbeits- 
platzvideosystemen. Hier wird der Augenbereich eines 
Anwenders editiert, urn den Eindruck zu erwecken, man sehe 
direkt in die Kamera statt auf den Monitor. Diese 
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Editierf unktion arbeitet unbemerkt vom Sender und 
Empf anger der Obermittlung. 

Es ist weiterhin belcannt, dass es im Fernsehbereich 
5 Verfahren gibt, die Inf ormationen vor der Weitergabe an 
die Sendeeinheit in Echtzeit oder fast in Echtzeit zu 
veranderri, Vorteil dabei ist, dass die geanderten 
Inf ormationen der vom Ersteller gewunschten Darstellung 
entsprechen bzw. nahe kommen. Zu- diesen Verfahren gehort 
*10 "Blue Box", "Maskierung" und "Automaskierung" , 

Wie bekannt, ubertragen die oben genannten audiovisuellen 
Kommunikationsdienste und -systeme mehr Inf ormationen als 
das Telefon. Zu diesen Inf ormationen zahlen unter anderem 

15 das Erscheinungsbild des sendenden Teilnehmers, seine 
Korpersprache, Mimik und Gestik sowie die Umgebung, die 
von der Videokamera eingefangen werden kann. Dabei 
entsteht jedoch das Problem, dass die Obertragung dieser 
visuellen Inf ormationen zu psychologischen Hemmschwellen 

20 bei der Nutzung der oben genannten audiovisuellen 
Kommunikationsdienste und -systeme fuhrt. Es gilt als 
sicher, dass diese psychologischen Hemmschwellen zum 
grofien Teil dazu beigetragen haben, dass sich 
beispielsweise das Bildtelefon immer noch nicht auf dem 

25 Markt durchgesetzt hat. 

Aufgabe und Vorteile der Erfindung 

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, 
30 ein Verfahren und eine Vorrichtung zu ermoglichen, die 
Anwendern der genannten audiovisuellen 



Kommunikationsdienste und -systeme die Kontrolle iiber den 
Austausch selbstbezogener Inf ormationen erm6glicht. 

Diese Aufgabe wird durch ein Verfahren und eine 
5 Vorrichtung jeweils mit den Merkmalen und Mitteln der 
Anspriiche '1 und 15 gel6st. 

Dem sendenden Teilnehmer von audiovisuellen Kommunika- 
tionssignalen wird durch die Erfindung die Moglichkext 
10 gegeben, den Inhalt so zu beeinf lussen, dass der 
gesendete Inhalt der Vorstellung des sendenden Teil- 
nehmers iiber seine Darstellung nahekorrant bzw. mit seiner 
vorstellung ubereinstimmt . Damit wird folgender Nachteil 
der bisherigen audiovisuellen Kommunikation iiberwunden: 
15 Der sendende Teilnehmer einer audiovisuellen Nachricht 
kann unabhSngig von seiner derzeitigen Erscheinung, z. B. 
morgens nach dem Aufstehen, bei Krankheit, Missgestal- 
tungen des Gesichts oder trotz eines aus anderen Grunden 
unvorteilhaften Erscheinungsbildes ungehindert kommunx- 
20 zieren. 

Durch die Verwendung der vorliegenden Erfindung, z. B. 
bei der Bildtelef onie, bei Videokonf erenzen, Arbeits- 
platzkonferenzen, Internet-Konf erenzen, etc. stellt ein 
95 jeweiliger Teilnehmer an einer audiovisuellen Kommuni- 
kation sicher, dass sein Erscheinungsbild und die von der 
Kamera ebenfalls eingefangene Umgebung beim empfangenden 
Teilnehmer seinem inneren Selbstwertverstandnis ent- 
spricht. Somit schiitzt die Verwendung der vorliegenden 
30 Erfindung die Privat- und Intimsphare. 



Gen,ai^ einem wesentlichen fispekt der Erfindung ist e.n d.e 
oblge Aufgabe losende. Verfahren zur dar=tellungs- 
optimlerten Obertragun, von vidaodaten und/oder Audxo- 
daten, insbe.ondare beim Bildfarnsprechen, bai dam von 
einar Vidao- und Audioqualla koMnande Bild- und Audio- 
daten vor ihrer Obartragung zu einam Empfangar anhand von 
Rafaranzlnformaticn entsprechand wanigstans ainem vorba- 
stli^tan Oder vorbe«irW.aran Krite.ium varSndert wardan, 

... ^ ^-,00 Hac; Verfahren wenigstens 
dadurch gekennzeichnet, dass das verranr 

folgende Schritte aufweist: 

a) Referenzbildinformation wird zuvor erstellt und 

qespeichert; 

b) Parameter, die Bildinf ormation betreffen, werden 
zuvor definiert, gespeichert und der in Schritt a) 
gespeicherten Ref erenzbildinf ormation zugeordnet; 

c) ein von einer Videoquelle kommendes Bild wird 
hinsichtlich eines oder mehrerer ausgew^hlter (auswahl- 
barer) Bildinformationsparameter von den in Schrxtt b) 
definierten und gespeicherten Parameter extrahiert; 

d) das Bild von Schritt c) wird basierend auf dem oder 
den ausgewahlten Bildinf ormationsparameter (n) anhand der 
zugeordneten Ref erenzbildinf ormation editiert; und 

e) das in Schritt d) editierte Bild wird zu einem oder 
mehreren Empfangern ubertragen. 

Die schritte d) und e) k5nnen bei einer Ausf tihrungsart an 
einem zentralen Ort ausgefuhrt werden, der vom sendenden 
Teilnehmer entfernt ist, wobei das Bild, das zugeordnete 
Referenzbild und der oder die Bildinformationsparameter 
vom ort des sendenden Anwenders zum zentralen Ort 
ubertragen werden- 



Alternativ konnen die Schritte a) bis e) am Ort eines 
sendenden Anwenders ausgefiihrt werden. 

Urn sicher zu stellen, dass nur ein berechtigter Anwender 
die anwenderspezifische Optimierung durchfuhren und mit 
edit-ierte'n Bildern und/oder veranderter Stimmlage auf 
Sendung gehen kann, weist das Verfahren einen z.usatz- 
lichen Schritt f) auf, mit dem zuvor gespeicherte Sprach- 
proben berechtigter Anwender mit einer gesprochen Kenn- 
phrase eines aktuell sendenden . Anwenders verglichen 
werden und bei positivem Vergleichsergebnis eine Sende- 
freigabe erfolgt. 

Dabei wird bevorzugt im Schritt f) die gespeicherte 
Sprachprobe einem Referenzbild zugeordnet, das zu einem 
j eweiligen sendenden Anwender gehort, und letzterer wird 
anhand der gespeicherten Sprachprobe und des zugehOrigen 
Referenzbildes identif iziert , wozu eine Bildanalyse und 
eine Sprachanalyse ausgefiihrt werden. 

Bei der Bildanalyse werden bevorzugt charakteristische 
Gesichtsziige eines j eweiligen Anwenders mit einem 
zugehorigen Referenzbild verglichen. 

Bevorzugt wird ein jeweiliger Anwender vor Ausfuhrung des 
Verfahrensschritts c) als berechtigt identif iziert , die 
•gespeicherten Ref erenzdaten zur Editierung des von ihm 
aufgenommenen Bildes und gespeicherte Sprachanderungs- 
algorithmen zur Anderung der Stimmlage seiner Sprache zu 
verwenden. 



Das erfindungsgemaiie Verfahren umfasst die anwender- 
spezifische Optimierung von Bewegtbildern, zweidimensio- 
nalen und dreidimensionalen • Bilddaten . 

Vorzugsweise wird das zu abertragende Bild, das 
gegebenenfalls anwenderspezif isch editiert wurde, vor der 
Obertragung dem jeweiligen Anwender angezeigt. 

Eine zur Durchf iihrung des obigen Verfahrens zur 
darstellungsoptimierten Obertragung von Video- und 
Audiodaten eingerichtete Vorrichtung ist erf indungsgemafi 
dadurch gekennzeichnet, dass die Vorrichtung aufweist: 

- Videoeingabe- und Ausgabemittel ; 

- Audioaus/eingabemittel; 

- Sende- und Empfangsmittel; 

- eine Schnittstelle zu einem Obertragungskanal; 

- eine Eingabevorrichtung zur Eingabe von Steuer- und 
Bef ehlssignalen; 

- eine Speichervorrichtung zur Speicherung von Anwehder- 
und Systemprogrammen sowie von Ref erenzbilddaten und 
-audiodaten, wobei 

die vorgenannten Mittel und Komponenten mit einer 
Prozessoreinheit in funktioneller Verbindung stehen, die 
dazu eingerichtet ist, die Verf ahrensschritte in 
Interaktion mit den genannten Mitteln und Komponenten 
auszufuhren. 
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Weitere vorteilhafte Merkmale ergeben sich aus der 
nachfolgenden Beschreibung bevorzugter Ausf tihrungsbei- 
spiele, die sich auf die beiliegende Zeichnung bezieht. 

Zeichnung 

Figur 1 "ist ein Blockdiagramm einer erf indungsgemaUen 
Vorrichtung zum Senden/Empf ang audiovisueller Inf orma- 
tionen mit anwenderoptimierten Inhalt. 

Figur 2 isf ein Blockdiagramm iiber Details der Funktions- 
gruppe "Speicher" gemaii Figur 1. 

Figur 3 ist ein Blockdiagramm von Funktionen bei der 
Anwendung der Vorrichtung der Figuren 1 und 2 ohne 
anwenderkontrollierte Optimierung . 

Figur 4 ist ein Blockdiagramm von Funktionen mit 
Anwendung einer anwenderkontrollierte Optimierung. 

Figur 5 ist ein Funktionsf lussdiagrarom von Verfahrens- 
schritten, wenn keine anwenderkontrollierte Optimierung 
ausgefiihrt wird, und 

25 Figur 6 ist ein Funktionsf lussdiagramm von Verfahrens- 
schritten, wenn eine anwenderkontrollierte Optimierung 
ausgefuhrt wird. 



30 
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Ausf uhrungsbeispiele 

Die Erfindung geht von dem Vorhandensein audiovisueller 
Kommunikationsmedien aus . Allgemeine Merkmale audio- 
visueller Kommunikationsmedien sind Mikrophon und Laut- 
sprecher/ Videokamera und Bildschirm, eine Steuerungs- 
einheit, eine Verarbeitungseinheit abgehend zur Verar 
beitung von Audio- und Videosignalen, einer Verar- 
beitungseinheit kommend zur Verarbeitung von Audio- und 
Videosignalen und einer Kompressionseinheit zur optimalen 
Ausnutzung der zur Verfiigung stehenden Leitungsband- 
breite, z. B. uber analoge und digitals Telef onnetze, 
paketgesteuerte Kommunikation uber das Internet, interne 
Computernetze usw. 

In der nachf olgenden Beschreibung werden die Begriffe 
"Teilnehmer" und "Anwender" synonym verwendet . Die 
vorliegende Erfindung erweitert die oben genannten 
Merkmale audiovisueller Kommunikationsmedien urn eine 
Funktion, die nachfolgend "optimierende Bildverarbeitung" 
(kurz: OBV) genannt wird. Die erfindungsgemalie' Funktion 
OBV kann sowohl in Videobildtelef onen, Videokonf erenz- 
systemen oder auf Internetprotokoll basierten Systemen 
angewendet werden. Es soli erwahnt werden, dass sich die 
Beschreibung hauptsachlich mit der anwenderkontrollierten 
OBV befasst, und die Sprachoptimierung nicht so 
detaill.iert behandelt wird. 

Die erfindungsgemalie OBV gibt dem Teilnehmer die Moglich- 
keit, 1-n optimierte Abbilder seiner gewiinschten Erschei- 
nung als Ref erenzbildinf ormation in einem oder auch 
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mehreren Speichermedien abzuspeichern . Dabei kOnnen auch 
Speichermedien unterschiedlicher physikalischer Art zum 
Einsatz koininen. 

Nun wird Bezug auf Figur 1 genoimnen, die ein 
Blockdiagramm einer Vorrichtung zeigt, die zur Ausfiihrung 
des-^erfindungsgemaiien Verfahrens, d. h. zum Senden/- 
Empfang audiovisueller Inf ormationen mit anwender- 
kontrollierter Optimierung einger-ichtet ist. 



Gemali Figur 1 steht eine zentrale Prozessoreinheit 10 in 
'funktioneller Verbindung mit einer Bildeingabeeinheit 11, 
z. B. einer Videokamera, mit einer Anzeigevorrichtung 12, 
z. B. einem PC-Monitor oder einer FlUssigkristallanzeige, 
15 mit einer Audioaus/eingabeeinrichtung 13, mit einer 
audiovisuellen Kommunikationseinheit 14, 15, 16, die aus 
einer Sendeeinheit 14, einer Empf angseinheit 15 und einer 
Schnittstelle 16 zu einem Telefonnetz, Funknetz, 
Mobilnetz oder Datennetz besteht, mit einer Schnittstelle 
20 17 zu einem iibergeordneten Speichermedium oder einem 
Rechner, wie z. B. einem Personalcomputer , mit einer 
Eingabevorrichtung 18, z. B. einer Telef ontastatur oder 
einer separaten Tastatur und mit einem Speicher 20, in 
dem zumindest . anwenderspezif ische Programme 21 und 
2 5 Referenzbilder 22 und gegebenenf alls Audioref erenzdaten 
gespeichert sind. 

Figur 2 zeigt, dass die Speichervorrichtung 20 mehrere, 
auch physikalisch unterschiedliche Speichermedien auf- 
30 weisen kann. Die optimierten Referenzinf ormationen, d. h. 
die Referenzbildinformation und die Ref erenzaudio- 



10 



information, werden zum einen iiber die Bildeingabeeinheit 
11, die eine Videokamera, ein Rekorder, etc., sein kann, 
die Audioeingabeeinheit 13, Oder von einer ubergeordneten 
Einheit iiber die Schnittstelle 17 in die Speichervor- 
richtung 20 iibertragen. Dabei ist es von untergeordneter 
Rolle, Ob. die Anwendungen und das Bildmaterial z. B. in 
einem ROM-Speicher , einem RAM-Speicher Oder einem Massen- 
speicher wie z. B. in einer Festplatte, in Flashcards 
Oder ahnlichen Medien zur Verfugung gestellt werden 
(Figur 2) . Wie erwShnt, kann der Speicher 20 auch 
Referenzaudioinformation enthalten, die zur anwenderkon- 
trollierten Optimierung seiner Sprache verwendet werden 
kann. Durch die Eingabevorrichtung 18 steuert der 
Anwender die , optimierende Bildverarbeitung, um nach 
seiner Wahl das zu sendende Bild oder seine Sprache zu 
optimieren. Die Eingabevorrichtung 17 kann z. B. eine 
Telefontastatur, ein separat angeschlossenes Tastaturfeld 
18, eine Computermaus, ein Lichtstift, ein "graphics 
tablet" etc. sein. 

In Figur 2 sind Einzelheiten der Speichervorrichtung 20 
sowie der darin gespeicherten anwenderspezif ischen 
Informationsinhalte 21 und der Ref erenzbilder 22 gezeigt. 
Wie dargestellt, .kann die Speichervorrichtung 20, die bei 
der Erfindung verwendbar ist, einen ROM-Speicher, RAM- 
Speicher, eine Festplatte, eine Wechselplatte, eine 
Floppy Disk, eine Flashcard und andere geeignete 
Speichermedien aufweisen. Sie kann auch eine Kbmbination 
solcher Speichermedien enthalten. In dem Inhaltsblock 21, 
in dem anwenderspezif ische Programme und Inf ormationen 
gespeichert sind, befindet sich ein Block 210 fur die 
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Benutzererkennung, ein Block 211 fur die technische 
Bildoptimierung mit verschiedenen Algorithmen 1, 2, ..-N, 
ein Block 212 fur die kosmetische Erscheinungsopti- 
mierung, wieder mit verschiedenen Bildbearbeitungsalgo- 
5 rithmen 1, 2, ...N, ein Block 213 zur Hinter- 
grundbearbeitung/ ein Block 214 zur Kopf bearbeitung und 
ein, Block 215 zur Korperbearbeitung . Es muss hier bemerkt 
werden, dass die im anwenderspezif ischen Block 21 
enthaltenen und oben aufgefuhrten Einzelblocke 211-215 
10 nicht unbedingt vollstandig aufgezahlt wurden und dass 
Speicherinhalte zur Spracherkennung und weitere. Inhalte, 
die hier nicht wesentlich sind, enthalten sein konnen. 

Der in Figur 2 dargestellte Block 22, der das Bild- 
15 material, d. h. die Ref erenzbildinf ormation betrifft, 
enthalt einen Block 221 mit Ref erenzhintergrundbildern 1, 
,..N, , einen Block 222 mit Ref erenzbildern 1, 2, . . .N des 
Kopfs und einem Block 223 mit Ref erenzbildern 1, 2, . . :N 
des Korpers des Anwenders. Es muss hier erwahnt werden, 
20 dass der Begriff "Korper" die Korperteile auBerdem Kopf 
umfassen. 

Fur eine audiovisuelle Kommunikationsvorrichtung gemafi 
der Erfindung, die fur mehrere Teilnehmer berechtigt ist, 
25 sind die Blocke 221-223 entsprechend mehrfach vorhanden. 

In Figur 3 ist in Form eines Funktionsblockschaltbildes 
eine Funktionsweise ohne senderseitige optimierende Bild- 
bearbeitung, d. h. ohne die erf indungsgemafie OBV. Die 
30 oben genannte OBV, die in einem Funktionsblock 40 
dargestellt ist, ist deaktiviert, und das Videosignal von 



der Videosignalquelle geht direkt zu einem Kodierungs- 
block 41. 



Dagegen zeigt Figur 4 in Form eines Funktionsblock- 
schaltbildes den Fall, wo eine optimierende Bildver- 
arbeitung .ausgefuhrt wird. 

Vor der Sendung wird das von einer Videosignalquelle 11 
erhaltene Videosignal zur Vorbereitung der Optimierung im 
Sirine der Erfindung durch einen Inhaltserkennungsblock 30 
in einzelne Ebenen 31-33 (englisch: "layers") aufge- 
schlusselt. Die Ebenen 31-33 sind hier niar zum Zwecke des 
besseren VerstSndnisses als Ebene 1 (Hintergrund) , Ebene 
2 (K6rper) und Ebene 3 (Kopf) bezeichnet. Diese Ebenen 
entsprechen den im Speicherbereich 22 gespeicherten 
Schichten Hintergrund 221, Kopf 222 und KSrper 223 
(vergleiche Figur 2). Diese Begriffe Hintergrund, Korper, 
Kopf dienen somit nur zur Veranschaulichung der 
Erfindung. Je nach Grolie des bereitgestellten Speichers 
konnen weite.re Ebenen zur weiteren Detaillierung 
definiert sein. Ebenfalls zur Veranschaulichung des Ver-, 
fahrens wird eine weitere, gestrichelt eingezeichnete, 
Spezialebene 34 definiert, die wahlweise zugeschaltet 
werden kann. Die beschriebenen Ebenen 31-34 werden aus 
dem Videosignalstrom von der Videosignalquelle 11, z. B. 
von der Videokamera, mit Bildverarbeitungsalgorithmen im 
Inhaltserkennungsblock 30 herausgelost und separat in 
logischen Speicherebenen verwaltet. Findet eine audio- 
visuelle Kommunikation statt, werden je nach Einstellung 
des Anwenders alle oder einzelne Ebenen durch Bild- 
information aus dem Speicher 22 ersetzt. Im Beispiel von 



• « • • • 

• • • « 



13 



Figur 4 werden die Ebenen 31 und 32, betreffend 
Hintergrund und Ref erenzkopf , ersetzt durch ein Referenz- 
hintergrundbild ^ 2 und ein Kopfbild 3 aus den Speicher- 
bereichen 221 und 222. Die Steuerung der eingesetzten 
5 Bildinformation wird durch Ref erenzmarken sichergestellt . 

Als Beispiel soli das Gesicht dienen. Die erkannten 
Ref erenzmarken werden zur Steuerung der einzusetzenden 
Bildinformation der .Ebene "Kopf" verwendet. Bewegt der 
10 Anwender den Kopf, wenn er z. B. zustimmend nickt, so 
fiihrt das optimierte Bild die gleiche Bewegung aus- 1st 
die Ebene "Korper" aktiviert, wird die aktuelle Ebene 
"Korper" durch eines der gespeicherten Korperref erenz- 
bilder im Bereich 223 ersetzt. Alle Ebenen zusammen- 
15 gesetzt bilden das zu sendende optimierte Videobild. 

Es muss hier bemerkt werden, dass die Bezeichnung "Ebene" 
nicht bedeutet, dass mit dem erf indungsgemaften Verfahren 
verarbeitete bzw. editierte Bildinformation nur zweidi- 
20 mensional sein kann. Statt dessen konnen auch drei- 
dimensionale Bildinf ormationen verarbeitet werden. 

Das neu zusammengesetzte Videobild wird jetzt technisch 
hinsichtlich Farbwerte, Kontraste, Helligkeit nach vor- 
25 eingestellten oder voreinstellbaren Parametern optimiert 
(siehe Block 42 in Figur 4) . 

In einer weiteren Funktionseinheit 43, die kosmetische 
Bildoptimierung genannt ist, werden bevorzugt im 
30 Gesichtsbereich kosmetische Verbesserungen vorgenommen. 
Dazu gehort das Aufhellen der Augen und die Augenwinkel- 



korrektur, Aufhellen des Zahnbereichs, Schattenauf hellung 
(z. B. bei Bartwuchs und bei groIJf lachigen Pigment- 
veranderungen der Haut) und das Wegretuschieren von nicht 
gewunschten kleinen Pigment storungen, wie z. B. Warzen. 

Das so optimierte Videosignal wird an die Kodierungs- 
einheit 41 weitergegeben und schlieiblich an den oder die 
Empf anger gesendet. 

Nachstehend werden bezogen auf die Figuren 5 und 6 
Kommunikationsschritte unter Einsatz des erfindungs- 
gemalien Verfahrens beschrieben. Zunachst wird eine 
Kommunikationsverbindung von auBerhalb beschrieben. Die 
audiovisuelle Koitimunikationsvorrichtung (Figur 1) erhalt 
ein Signal von der Gegenseite zum Aufbau einer Ver- 
bindung. Dem Stand der Technik entsprechende Kommunika- 
tionssysteme iibermitteln eine sog. Anruferkennung 
(englisch: "Caller Recognition"). Bei eingehendem Anruf 
(Schritt 51) wird die Anruferkennung iiberprtift (Schritt 
53) . Dies erfolgt durch Vergleich der ubermittelten 
Anruferkennung mit einem Teilnehmerverzeichnis 52 
(Telefonbuch mit Teilnehmeradressen) , das im Speicher 
gespeichert ist. Den EintrSgen des Teilnehmerver- 
zeichnisse 52 konnen bestimmte OBV-Konf igurationen zuge- 
ordnet werden. Im vorgestellten Beispiel wird davon 
ausgegangen, dass der Anrufer entweder keinen Eintrag im 
Teilnehmerverzeichnis 52 hat oder dass dem Eintrag im 
Teilnehmerverzeichnis 52 die OBV-Konf iguration "Buro" 
zugeordnet wurde. In die.sen Fallen wird das Signal der 
Videokamera 11 an den inhaltserkennungsf unktionsblock 30 
weitergeleitet, der Schritt 57 berechnet die Ebenen 



(31-34 in Figur 4), die im Schritt 58 . mit den 
Referenzinformationen der OBV-Konf iguration "Euro" in 
Echtzeit zusammengesetzt werden. Danach wird die bereits 
erwahnte kosmetische Bildoptimierung 4 3 und die 
technische Bildoptimierung 42 ausgefUhrt. Nach der 
technischen Bildoptimierung 42 entsteht im Block 40 das 
opti-mierte Videobild nach den voreingestellten Parameter- 
werten in Zuordnung zum Teilnehmereintrag im Verzeichnis 
52. Die Signale, d. h. die optimierten Bilder und 
Audiosignale werden anschlieliend je nach Kommunikations- 
protokoll im Funktionsblock 41 kodiert und ubertragen. 

Nun wird bezogen auf Figur 5 der Fall betrachtet, dass a) 
der gewiinschte Teilnehmer dem Teilnehmerverzeichnis 52 
bekannt ist (Ausgang "JA" des Vergleichsschritts 53) und 
dass b) dem Teilnehmer die OBV-Konf iguration "Privat" 
zugeordnet ist (Schritt 55) . Dann wird das unbearbeitete 
Videosignal, d. h. ohne OBV, der Kodierungseinheit 41 
iibermittelt. 

Anschlieliend wird Bezug auf Figur 6 genommen, die einen 
Verbindungsaufbau vom vorliegenden Anwender darstellt. 
Wenn der vorliegende Anwender eine Kommunikation aufbauen 
mochte, hat er die MOglichkeit, einen Teilnehmer aus dem 
Teilnehmerverzeichnis auszuwahlen (Schritt 62) oder den 
entsprechenden Teilnehmercode manuell einzugeben (Schritt 
61). Gesetzt der Fall, der gewiinschte Teilnehmer wird aus 
dem Teilnehmerverzeichnis 62 gewahlt, lautet die Antwort 
auf. die im Schritt 64 gestellte Frage: Code ID bekannt? 
"Ja". Dann wird nach Maftgabe des OBV-Parameters im 
Teilnehmerverzeichnis 62 die OBV-Konf iguration "Freizeit" 
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aktiviert (Schritt 66). In diesem Fall wiinscht der An- 
wender nur eine kosmetische Bildoptimierung im Funktions- 
block 43 und die technische Bildoptimierung im Funktions- 
block 42. Das hierdurch veranderte Videosignal wird 
5 sodann . nach den Erf ordernissen des Kommunikations- 
protokolls im Funktionsblock 41 kodiert. 

Anschlieliend wird ein Beispiel toeschrieben, wo der 
Anwender den erforderlichen Verbindungscode im Schritt 61 

10 manuell uber die Eingabeeinheit 18 (Figur 1) eingibt. Die 
im Abfrageschritt 64 ausgeftihrte Oberprufung der manuell 
eingegebenen Teilnehmernummer oder -adresse ergibt im 
Beispiel eine negative Antwort bei der Abfrage 64. 
Daraufhin aktiviert die OBV die Konf iguration "Btiro" . 

15 Daraufhin wird die komplette Bildbearbeitung, d. h. 
Optimierung der Bildinf ormation und gegebenenf alls der 
Audioinformation ausgefuhrt. Die Ausfuhrung der Opti- 
mierung der Audioinformation ist in den Figuren 5 und 6 
nicht dargestellt. Das editierte Signal wird dann an die 

20 Kodierungseinheit 41 weitergegeben . 

Abgesehen von dieser automatischen Auswahl zwischen der 
vollstandigen OBV-Funktion und der "rudimentaren Edi-. 
tierung" der Bildinf ormation durch die kosmetische 
25 Bildoptimierung 43 und die technische Bildoptimierung 42, 
hat der Anwender jederzeit die MSglichkeit, uber die 
Eingabeeinheit 18 die OBV-Konf iguration wahrend einer 
Kommunikation zu aktivieren oder zu deaktivieren ! 

30 Das vorbeschriebene erf indungsgemalie Verfahren kann auch 
dazu verwendet werden, urn z. B. Gesichter anderer 
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Menschen oder ganzlich kunstlich erstellte Charaktere zu 
ubertragen. Dabei kann der Anwender als "Animateur" 
auftreten. Die durch die Erfindung ermoglichte Durch- 
fuhrung solcher "Animationen" ist wahrscheinlich koimner- 
5 ziellen Anwendung vorbehalten, Hier wird z. B. vom Wunsch 
von Unternehmen ausgegangen, einen bestimmten Charakter 
als^Marke zu etablieren. Zur Veranschaulichung sei der 
Charakter "Herr Kaiser" eines Versicherungsunternehmens 
und aufierdem der Charakter "Micky Maus" der Walt Disney 

10 Corporation angefuhrt. Eine kommerzielle Anwendung ist 
hierbei die Bereitstellung einer erf indungsgemalien OBV 
fur Telef onagenturen. Unternehmen beauftragen Telefon- 
agenturen, urn Kundenanf ragen und -wunsche zu beantworten 
Oder aufzunehmen. Kunden des oben als Beispiel ange- 

15 fuhrten Versicherungsunternehmens kommunizieren auf diese 
Weise audiovisuell mit dem durch OBV etablierten 
Sympathietrager des Unternehmens . Kinder und Jugendliche 
konnen uber sympathische Comicf iguren, wie z. B. Micky 
Maus, durch das Unternehmen Inf ormationen uber spezielle 

20 Aktionen und Tips zur Freizeitgestaltung erfahren. 

Um einen Missbrauch des vorbeschriebenen Verfahrens zu 
unterbinden, stehen Algorithmen zur Gesichtserkennung zur 
Verfugung. Die Gesichtserkennung ist Bestandteil der 
25 Steuerung der oben beschriebenen Ebene "Kopf", Sofern der 
Anwender nicht die gleichen charakteristischen Gesichts- 
merkmale wie das abgespeicherte Kopfbild hat, wird das 
Videosignal uneditiert an ' die Kodierungseinheit zur 
Sendung weitergegeben . 
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Weiterhin enthalt das vorbeschriebene Verfahren zur Aus- 
wahl von berechtigten Teilnehmern Sprache.rkennungsalgo- 
rithmen, welche vor allem in konunerziellen Anwendungen 
aktiviert sind. Ein aktueller Teilnehmer . spricht eine 
5 Kennphrase, die mit gespeicherten Sprachproben verglichen 
wird. Ergibt sich eine Obereinstimmung, kann zusatzlich 
noch eine Korrelation mit der erwahnten Bilderkennung 
anhand eines gespeicherten Kopfbildes hergestellt werden. 
Somit ist ein Missbrauch der Er^indung durch Personen- 
10 verwechslung oder Vortauschung von anderen Personen 
ausgeschlossen . 
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Verfahren und Vorrichtung zur darstellungs- 
optimierten Ubertragung von Video- und Audiodaten 



PATENTANSPROCHE 



1. Verfahren zur darstellungsoptimierten Uber- 
tragung von Videodaten und/oder Audiodaten, insbesondere 
beim Bildfernsprechen, bei dem von einer Video- und 
,Audioquelle kommende Bild- und Audiodaten vor ihrer 
Obertragung zu einem Empf anger anhand von 
15 Referenzinformation entsprechend wenigstens einem 
vorbestimmten oder vorbestimmbaren Kriterium verandert 
warden, dadurch gekennzeichnet, dass das Verfahren 
wenigstens folgende Schritte aufweist: 

a) Referenzbildinformation wird zuvor erstellt und 

20 gespeichert ; 

b) Parameter, die Bildinf ormation betreffen, werden 
zuvor definiert, gespeichert und der in Schritt a) 
gespeicherten Referenzbildinformation zugeordnet; 

c) ein von einer Videoquelle kommendes Bild wird 
25 hinsichtlich eines oder mehrerer - ausgewahlter 

(auswahlbarer) Bildinf ormationsparameter von den in 
Schritt b) definierten und gespeicherten Parameter 
extrahiert ; 

d) das Bild von Schritt c) wird basierend auf dem oder 
30 den ausgewahlten Bildinf ormationsparameter (n) anhand der 

zugeordneten Referenzbildinformation editiert; und 
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e) das in Schritt d) editierte Bild wird zu einem oder 
mehreren Empfangern ubertragen. 

2. verf ahren ■ nach Anspruch 1, dadurch gekerxnzeichnet, 
dass die Schritte d) und e) an einem zentralen Ort 
ausgefiihrt werden, der vom sendenden Anwender entfernt 
ist,. wobei das Bild, das zugeordnete Referenzbild und der 
Oder die Bildinf ormationsparameter vom Ort des sendenden 
Anwenders zum zentralen Ort ubertragen werden. 

3. verf ahren nach Anspruch 1, dadurch gekennzeichnet, 
dass die schritte a) bis e) am Ort eines sendenden 
Anwenders ausgefiihrt werden. 

15 4. verf ahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, dass es einen zusatzlichen 
schritt f) aufweist, mit dem zuvor gespeicherte Sprach- 
proben berechtigter Anwender mit einer gesprochenen Kenn- 
phrase eines aktuell sendenden Anwenders verglichen 

20 werden und bei positivem Vergleichsergebnis eine Sende- 
freigabe fur diesen Anwender erf olgt . 

5. Verf ahren nach Anspruch 4, dadurch gekennzeichnet, 

dass in Schritt f) auBerdem die gespeicherte Sprachprobe 
25 einem Referenzbild, das zu einem jeweils sendenden 
Anwender gehort, oder als zu ihm gehorig ausgewahlt 
wurde, zugeordnet wird, und der jeweilige sendende 
Anwender anhand der gespeicherten Sprachprobe und des 
zugehorigen Ref erenzbildes identif iziert wird. 
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6. Verfahren nach Anspruch 4 oder 5, dadurch gekenn- 
zeichnet, dass in Schritt f) eine Sprachanalyse der 
gesprochenen Kennphrase und eine Bildanalyse des von der 
Videoquelle kommenden Bildes ausgefuhrt warden. 

7. verfahren nach Anspruch 6, dadurch gekennzeichnet , 
dass- bei "der Bildanalyse charakteristische Gesichtszuge 
eines jeweiligen sendenden Anwenders - mit einem zuge- 
horigen oder ausgewahlten Referenzbild verglichen werden. 



8. Verfahren nach einem der Anspriiche 5-7, dadiarch 
gekennzeichnet, dass der jeweilige sendende Anwender vor 
Ausfiihrung des Schrittes c) als berechtigt identif iziert 
wird, gespeicherte Ref erenzinf ormation zur audiovisuellen 

15 Kommunikation zu verwenden. 

9. verfahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, dass die zu verarbeitenden Bild- 
daten, die analysierte und editierte Bildinf ormation 
Bewegtbilder, zweidimensionale und dreidimensionale Bild- 
inf ormation umfassen. 

10. verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, dass das zu ubertragende Bild vor 
der Obertragung dem sendenden Anwender angezeigt wird. 

11. verfahren nach Anspruch 10, dadurch gekennzeichnet, 

dass die Anzeige eine interaktive Benutzeroberf lache 
aufweist, die auch die auswahlbaren und/oder ausgewahlten 
Referenzbilder sowie die auswahlbaren oder ausgewahlten 
Bildinf ormationsparameter anzeigt . 



12. Verwendung des Verfahrens nach einem der AnsprUche 
1-11 zur darstellungsoptimierten Obertragung von Video- 
und/oder Audiodaten beim Bildf ernsprechen. 

13. Verwendung des Verfahrens nach einem der Anspruche 
1-11_ zur -darstellungsoptimierten Obertragung von , Video- 
und/oder Audiodaten , bei Videokonf erenzen . 

14. Verwendung des Verfahrens nach einem der Anspruche 
1-11 zur darstellungsoptimierten Obertragung von , Video- 
und/oder Audiodaten . uber Computernetze . 

15. Vorrichtung zur darstellungsoptimierten Obertragung 
von Video- und/oder Audiodaten, insbesondere zur 
Durchfuhrung des Verfahrens nach einem der Anspruche 
1-14, dadurch gekennzeichnet , dass die Vorrichtung 
auf weist : 

- Videoeingabe- und Ausgabemittel (11, 12); 

- Audioaus/eingabemittel (13); 

- Sende- und Empf angsmittel (14, 15) ; 

- eine Schnittstelle (16) zu einem Obertragungskanal; 

- eine Eingabevorrichtung (18) zur Eingabe von Steuer- 
und Befehlssignalen; 

- eine ' Speichervorrichtung (20) zur Speicherung von 
Anwender- und Systemprogrammen sowie von Referenz- 
bilddaten und -audiodaten, wobei 

die vorgenannten Mittel und Komponenten mit einer 
Prozessoreinheit (10) in f unktioneller Verbindung stehen, 
die dazu eingerichtet ist, die Verf ahrensschritte in 



Interaktion mit den genannten Mitteln und Komponent 
auszufiihren. 



16. Vorrichtung nach Anspruch 15, dadurch gekenn- 
zeichnet/ dass sie weiterhin eine mit der Prozessor- 
einheit (10) in Verbindung stehende Schnittstelle (17) 
aufweist zur Verbindung mit einer tibergeordneten Ver- 
waltungseinheit und/oder einem tibergeordneten Speicher- 
medium, z. B. mit einem "Personal - Computer" . 
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ZUSAMMENFASSUNG 

Die Erfindung betrifft ein Verfahren und eine Vorrichtung 
fur. die ' asthetische und inhaltliche Veranderung und 
Optimierung des Videoinhalts und Audioinhalts zwischen 
zwei Oder mehr Teilnehmern einer . audiovisuellen Kommuni- 
kationsverbindung, wis Bildtelefon uber Festanschluss, 
Bildtelefon iiber Short-Range und Long-Range Funkver- 
bindung sowie andere audiovisuelle Kommunikationsmittel, 
z. B. uber Personal Computer, die in einem Netz verbunden 
sind. Von einer Videosignalquelle (11) kommende Bilder 
eines Teilnehmers werden einer Inhaltserkennung (30) 
unterworfen und in verschiedene Ebenen (31-34) unter- 
teilt,. wie z. B. in Hintergrund, Korper, Kopf. Dabei kann 
nach Wahl des Anwenders eine oder mehrere dieser Ebenen 
durch ein in einem Speicher abgelegtes Referenzbild oder 
mehrere Referenzbilder- ersetzt werden. Dies geschieht in 
einer "optimierenden Bildverarbeitung" (40) . Zusatzlich 
kann eine technische und kosmetische Bildpptimierung (42, 
43) ausgefuhrt werden. Das erf indungsgemafie Verfahren 
enthalt zudem Algorithmen zur Erkennung von Gesichtszugen 
eines Teilnehmers^ sowie zur Spracherkennung, so dass 
durch Vergleich des abgespeicherten Ref erenzgesichts- 
bildes mit dem Gesicht des Teilnehmers sowie einer 
Kennungsphrase mit abgespeicherten Sprachproben ermittelt 
werden kann, ob ein aktueller Anwender berechtigt ist 
Oder nicht (Figur 4) . 




